Система проверки текстов на заимствования из других источников (System of Duplicate Texts Detection)
نویسندگان
چکیده
منابع مشابه
Фонетико-семантические сходства заимствований тематического поля «пища» в русском и персидском языках
Краткое содержание Заимствование является одним из важных источников пополнения словарного состава языка, являющееся следствием языковых контактов. В статье проанализированы заимствования тематического поля «пища» в русском и персидском языках с фонетико-семантической точки зрения. Авторами была произведена попытка определить пути прямого и косвенного проникновения слов из одного языка в дру...
متن کاملDomEx: Extraction of Sentiment Lexicons for Domains and Meta-Domains
In this paper we describe a DomEx sentiment lexicon extractor, where a new approach for domain-specific sentiment lexicon extraction is implemented. Sentiment lexicon extraction is based on the machine learning model comprising a set of statistical and linguistic features. The extraction model is trained in the movie domain and then can be utilized to other domains. The system can work with var...
متن کاملCorpus Construction Tools
Современное развитие вычислительной техники позволяет нам принять участие в раньше невозможных направлениях научного исследования естественного языка. Основной, необходимой базой данных являются корпусы языков, в том числе и репрезентативные большие (национальные) корпусы. Уже широко доступны общие программные средства позволяющее эффективно обрабатывать большие количества текстов, как и средст...
متن کاملМетоды обнаружения массово порождаемых неестественных текстов на основе анализа разнообразия тематической структуры текстов (Detecting Mass-Generated Unnatural Texts through Topical Diversity Analysis)
متن کامل
Онтологическое моделирование и публикация данных об особо охраняемых природных территориях (Ontological Modeling and Publishing Data on Protected Natural Parks)
Благодаря перечисленным выше особенностям наборы пространственных данных достаточно легко переносятся из традиционного гипертекстового Веб в Семантический Веб. На практике это означает простоту включения геопространственных наборов данных в проект Linking Open Data [3], целью которого является наполнение сети Интернет данными в стандартных форматах Semantic Web [9], а также устанавливание связе...
متن کامل